查看原文
其他

关闭数据中心,淘汰大型机,预估节省 4 亿美元,上云真香!

钰莹 AI前线 2022-08-06

作者 | 钰莹
关闭数据中心,淘汰大型机预计节省 4 亿美元

根据外媒报道,联邦快递将在未来两年内逐渐关闭其数据中心并淘汰所有剩余的大型机。在最近举办的投资者日上,联邦快递首席信息官 Rob Carter 表示,该公司的目标是建立一个基于云的“零数据中心、零大型机”环境,这预计每年将节省 4 亿美元。

“这十年来,我们一直在努力精简和简化我们的技术和系统,我们已经转向云...... 一直在一个接一个地消除单一应用程序...... 我们正在转向一个更灵活、更安全和更具成本效益的零数据中心、零大型机环境的。”

在接下来的两年内,联邦快递将关闭剩下的最后几个数据中心,消除最后 20% 的大型机占用空间,并将剩余的应用程序迁移到云原生结构中,以便能够在市场和业务中灵活部署和使用。

根据资料显示,目前该公司是 Oracle Cloud 和 Microsoft Azure 的客户。

试图确定联邦快递数据中心的规模是困难的,该公司并未透露拥有多少设施。根据数据中心跟踪网站 Baxtel 的说法,联邦快递只有一个数据中心:其位于科罗拉多斯普林斯,于 2011 年开业。

根据一些媒体的报道,联邦快递于 2008 年首次在科罗拉多斯普林斯开设了一个本地数据中心,并于 2011 年进一步扩大面积。2008 年,该公司又在其他地方收购了超过 70 英亩的土地,根据报道,这也是一个数据中心项目,但目前尚不清楚是否实现了。

2019 年,该公司宣布与 Switch Inc. 达成一项为期 10 年的协议,将公司作为联邦快递在美国西部的数据中心。根据协议,Switch 将在第一年提供 2.5MW 的容量,到第十年达到 8MW。

联邦快递此前曾表示计划与英特尔和 Switch 合作,在美国各地的联邦快递地点建立 Edge 数据中心,这是否已经实现尚不清楚。

确定有多少员工在其数据中心工作也不是一件容易的事——该公司雇佣了超过 60 万名员工,但仅将这些数字分解为其业务部门,而不是地点或工作类型。

联邦快递至少三年来一直在研究上云这件事情,并于 2019 年与 Switch 合作,在 Switch 的拉斯维加斯数据中心托管其美国西部的业务。这家公司与 Switch 签订了一份为期 10 年的合同,虽然目前尚不清楚 Switch 将在其全云未来中扮演什么角色,但该合同意味着它很可能会在其中发挥作用。

关停老旧数据中心有多难?

说起来容易,实际上关闭数据中心并迁移上云比构建数据中心还要复杂。曾经的 Netflix 在长达 7 年的勤奋努力之后,才终于完成云迁移,并且关闭了流媒体服务使用的剩余数据中心。

此前,美国橡树岭国家实验室(ORNL)的泰坦(Titan)超级计算机的退役同样揭示了关闭数据中心过程的复杂程度。40 多人参与,包括 ORNL 公司、超级计算机制造商 Cray 和部分外包。首先要求专业电工安全关闭电力容量为 9MW 的供电系统,而 Cray 公司员工着手拆卸和回收泰坦超级计算的电子设备及其金属部件和机柜。还有一个单独的团队负责处理冷却系统。最终,350 吨设备和 10800 磅制冷剂被运出现场。

展开来说,整个过程大致分为如下几个步骤。

第一步:清点数据中心资产

制定完整的数据中心资产清单,鉴于 IT 环境中存在大量的僵尸服务器,无形中为这项工作增加了难度,企业需要知道自己有哪些支持?拥有哪些设备?哪些应用程序在哪些设备上运行?每个设备上都有哪些数据?

第二步:绘制数据中心资源之间的依赖关系

企业的 IT 部门需要在数据中心中绘制依赖关系。数据中心的运营时间越长,就可能会发现更多依赖。其中,对数据中心内容进行分段非常重要,这样就可以按顺序进行移动,并减少发生问题的风险。

第三步:企业可寻求专业供应商的帮助

考虑到数据中心关闭的复杂性和人力需求,企业可以聘请专业人员来完成这项工作,但应该全面了解整个过程。比如,让供应商为企业提供详细的工作说明,阐明如何处理数据中心退役项目的各方面;开始之前参与演练;了解供应商提供哪些具体工作,包括人工拆除或数据破坏;查询回收措施;询问相关案例;询问能够从退役的 IT 硬件中回收价值,确定赔偿金额和付款时间;询问如何销毁数据;了解有关数据销毁的安全协议;安全回收电子产品;对过程参与人员进行有效管理。

Lyft 反向安利警惕云端开发,这里有坑

虽然越来越多的公司选择关停数据中心,全面转向云端,但根据 Lyft 的经验,上云可以,云端开发还是要谨慎的。

早在 2018 年,Lyft 的工程师就将一个大单体拆分成了一系列微服务。基于 Docker 容器的模块化开发环境最终转移到了云端。然而随着时间的推移,工程师、微服务和测试的数量的激增,他们的开发工具跟不上了。

实际上,Lyft 对综合开发环境的第一次重大投资始于 2015 年,当时的工程师人数为 100 名,大部分开发还是在一个单体架构上,只有少数用例是微服务,但预计到工程师和服务的数量会增长,所以他们认为迁移到容器是很有意义的。最初的计划是构建一个基于 Docker 的容器编配环境,工程师可以用它们做测试。它将在生产环境中使用多租户环境,相比以前的解决方案,可以更便宜、更快地进行伸缩。

2016 年初,Lyft 发布了一个本地开发环境,叫作 Devbox,是“盒子里的开发环境”的缩写,由一些管理本地虚拟机及其配置的工具组成,包括数据生成、包和镜像的下载和安装。开发人员只需要发出一个命令就可以构建一个可以处理请求的环境。

这些体验很棒,让工程师们第一次拥有了一种一致的、可重复的、简单跨多个服务开发方法,于是很快出现了共享这些环境的需求。Devbox 转向了云端,变成了 Onebox。Onebox 本质上是一个运行在 EC2 实例上的 Devbox 环境。由于它的容量更大,下载镜像的速度更快,工程师们自然更喜欢它而不是 Devbox。

在将 Devbox 和 Onebox 作为容器化开发环境引入四年后,使用这些环境的工程师增加了十倍,微服务数量也一直在激增,配置和启动 Onebox 实例变得越来越困难和耗时。

由于每个服务都有很深的交互树结构,实例可能需要很多的资源。可观察性工具不能跟上所有正在运行的环境,导致调试工作变得很困难。

将开发环境迁移到 Kubernetes 之后,工程资源的变化让大家不得不重新审视开发环境:维护基础设施以支持这些按需环境变得过于昂贵,而且只会随着时间的推移而恶化,所以需要对开发和测试微服务的方式进行更根本性的改变。

为了摆脱不断增长的烦恼和挫折,Lyft 将开发环境带回到工程师的笔记本电脑上,同时重新构建内部开发循环。在容器中运行代码并不是一种免费的抽象,因此他们决定在 MacOS 的隔离环境中运行服务代码,不使用容器或虚拟机。

总之,关闭数据中心需谨慎,这不是一项简单的工作,可能会比建设数据中心还要复杂;上云可以,但业务激增之后考虑使用云端开发需谨慎,这带来的效果未必就比本地开发好。

参考链接:

https://www.datacenterdynamics.com/en/news/fedex-to-close-data-centers-retire-all-mainframes-by-2024-saving-400m/

https://www.infoq.cn/article/VKwOUJziYQVk0a0MqHBc

活动推荐

历经三年,包括 QQ、微信、王者荣耀、腾讯会议等亿级用户规模的腾讯自研业务已全面上云,集群规模突破 5000 万核,累计节省成本超 30 亿,这使得腾讯打造出国内最大规模的云原生实践。

7 月 15 日 14:00,ArchSummit 全球架构师峰会将落地深圳,大会设置了 「腾讯自研业务大规模云原生实践专场」,邀请了腾讯多位技术专家现场分享腾讯云原生实践经验及技术思考,话题方向涵盖大规模容器管理、云原生数据库、安全可观测性、GPU 上云等,不要错过现场交流的机会~~ 感兴趣的同学请扫码或点击阅读原文报名。

今日荐文

点击下方图片即可阅读

万豪N条入住记录、员工工资等数据又遭泄露,黑客:安全水平很差,数据窃取基本没难度


你也「在看」吗?👇

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存